home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9611 / 000070_owner-urn-ietf _Wed Nov 6 15:52:05 1996.msg < prev    next >
Internet Message Format  |  1997-02-19  |  6KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id PAA17065 for urn-ietf-out; Wed, 6 Nov 1996 15:52:05 -0500
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id PAA17059 for <urn-ietf@services.bunyip.com>; Wed, 6 Nov 1996 15:51:56 -0500
  3. Received: from IG.CS.UTK.EDU by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA13528  (mail destined for urn-ietf@services.bunyip.com); Wed, 6 Nov 96 15:51:38 -0500
  5. Received: from localhost by ig.cs.utk.edu with SMTP (cf v2.11c-UTK)
  6.           id PAA10773; Wed, 6 Nov 1996 15:32:28 -0500 (EST)
  7. Message-Id: <199611062032.PAA10773@ig.cs.utk.edu>
  8. X-Uri: http://www.cs.utk.edu/~moore/
  9. From: Keith Moore <moore@cs.utk.edu>
  10. To: Martin J Duerst <mduerst@ifi.unizh.ch>
  11. Cc: moore@cs.utk.edu (Keith Moore), tallen@fsc.fujitsu.com,
  12.         urn-ietf@bunyip.com
  13. Subject: Re: [URN] I18N does not belong in URNs 
  14. In-Reply-To: Your message of "Wed, 06 Nov 1996 18:02:19 +0100."
  15.              <"josef.ifi..172:06.10.96.17.02.21"@ifi.unizh.ch> 
  16. Date: Wed, 06 Nov 1996 15:32:28 -0500
  17. Sender: owner-urn-ietf@services.bunyip.com
  18. Precedence: bulk
  19. Reply-To: Keith Moore <moore@cs.utk.edu>
  20. Errors-To: owner-urn-ietf@bunyip.com
  21.  
  22. > >> >> Your
  23. > >> >> last point would have merit were it not that we absolutely must
  24. > >> >> be able to grandfather in existing name spaces.
  25. > >> >
  26. > >> >Yes, we must be able to grandfather existing name spaces *that serve
  27. > >> >similar purposes to URNs*.  ISBNs qualify.  Handles qualify.
  28. > >> >Usenet message-ids qualify.  But URNs don't have to handle existing
  29. > >> >name spaces that don't have the characteristics that URNs have.
  30. > >> And the fact that you
  31. > >> don't know about any such namespaces doesn't guarantee that there
  32. > >> are no such namespaces.
  33. > I thought I didn't know any such namespaces when I wrote this mail.
  34. > But I have become aware that my postal savings account number in
  35. > Japan contains a kanji. The set of kanji in this case is limited
  36. > to one each for each of the central offices that keeps track of
  37. > postal savings accounts. I am very sure also that there are lots
  38. > of other examlpes that fit the requirements of URNs at least as
  39. > well as ISBNs that contain kanji or other non-ASCII characters.
  40.  
  41. Perhaps.  I don't have as big a problem with this, as long as
  42. there's a discipline about how they are assigned that prevents
  43. URNs from being used as search strings.  That's my main worry.
  44. (URNs are also supposed to be transcribable, but I recognize that
  45. only a very small set of characters is transcribable by everyone
  46. on the planet.)
  47.  
  48. Sorry, I can't make heads or tails of this.
  49.  
  50. > So for grandfathering, we have two choices.
  51. > 1) We interpret it as "direct grandfathering of characters",
  52. >     in which case we have to allow a really wide range
  53. >     of characters (i.e. ISO 10646).
  54. > 2) We interpret it as "indirect grandfathering", in which
  55. >     case the digits, or whatever small set, will be
  56. >     enough.
  57.  
  58. I suspect there will be some of each.  But we want the transformations
  59. from "old identifier" to URN to be simple and easy to remember.
  60. Ideally, you just prepend a URN:namespace: string.  In some cases
  61. it may be necessary to remove punctuation; for instance, we might
  62. want to remove '-' characters from ISBNs.  But that gets specified
  63. on a per-namespace basis.
  64.  
  65. > Choosing ASCII only as for URLs would be very unfair cheating.
  66.  
  67. If the names aren't human meaningful, I don't see what you're
  68. complaining about.
  69.  
  70. > >> I definitely hate to see i18n just being moved around and delayed
  71. > >> by some people. With UTF-8 in URNs, we have made great progress.
  72. > >
  73. > >No, this is a big step backward.  Just because there is a new layer
  74. > >being defined doesn't mean that I18N belongs there.  
  75. > >
  76. > >I18N *is* important  -- and I'd be happy to see a draft document or 
  77. > >draft charter for a working group to define a protocol (say an extension
  78. > >of http/html) to resolve human-friendly names into URNs or URLs.
  79. > Why is there a need for an additional protocol layer?
  80. > There is no need currently for English, is it?
  81.  
  82. Yes, there is.  Human-friendly names are inherently ambiguous,
  83. and have ambiguous meanings which require a human being to untangle.
  84. (If I ask for "Julius Caesar", do I mean the Shakespeare play or 
  85. the person or what?  Most people would think the name is unambiguous--
  86. after all, they already know what they have in mind and the other 
  87. meanings will not occur to them.  But if you feed "Julius Caesar"
  88. to a library catalog, you will get back large numbers of hits.
  89. By contrast, if you feed )
  90.  
  91. URNs should be precise enough that a human isn't required to
  92. disambiguate the result.
  93.  
  94. > And I don't want to have to search through long lists
  95. > of possible answers just because I use Japanese, whereas
  96. > I will get one immediate answer for English.
  97.  
  98. The point is that you will often get multiple answers for English.
  99. English names are no more precise than names in other languages.
  100.  
  101.  
  102. > >> Some protocols (notably FTP) are also going in the direction of
  103. > >> UTF-8. Ideally, we will have a uniform solution for both URLs
  104. > >> and URNs, based on UTF-8. 
  105. > >
  106. > >No.  Ideally, if we figure out how to do this, we will have a 
  107. > >uniform solution for all URLs.  I18N (and even E8H :) absolutely 
  108. > >doesn't belong in URNs.
  109. > Well, if URLs are uniformly internationalized, I wouldn't
  110. > mind about URNs. But I know that there are people, and
  111. > this probably includes you, that claim that URLs also
  112. > are not designed to be human-friendly.
  113.  
  114. They weren't *designed* to be human-friendly, and they don't do 
  115. a very good job of it (if nothing else, they're hard to type and you 
  116. can't easily say them out loud).  But URLs tend to reflect their 
  117. underlying file and directory structures, which *are* (sort of)
  118. human-friendly.  (really they're more author-friendly)
  119.  
  120. > >For URNs, human-friendliness will be excluded by design.
  121. > I18N and human-friendliness are not the same thing.
  122. > For direct grandfathering, I18N is needed. If you are
  123. > sure human-friendliness will not sneak into URNs
  124. > with ASCII, it will also not sneak into URNs with
  125. > UTF-8.
  126.  
  127. I think URNs need restrictions on human-friendliness in either case.
  128.  
  129. Keith